基于Meta分析的中国森林水源涵养空间分布数据集

  1, 2,史文娇1,3*,陶福禄1,3*

1. 中国科学院地理科学与资源研究所,中国科学院陆地表层格局与模拟院重点实验室,北京100101
2.
江苏省测绘工程院,南京 2100133. 中国科学院大学资源与环境学院,北京 100049

  森林水源涵养服务是存储和调控水资源的重要过程,基于Meta分析的中国森林水源涵养空间分布数据集以收集的1,045个关于全国森林水源涵养的相关参数及其影响因素的观测点数据为基础,通过综合蓄水能力法计算了点尺度观测的林冠截留、枯落物持水和土壤蓄水,然后利用随机森林模型预测了森林及其各蓄水层水源涵养空间分布。研究结果表明,基于观测数据利用随机森林模型在预测中国森林水源涵养空间分布上有较好的成效。中国森林水源涵养能力总体呈南高北低的趋势,四川、西藏、云南的森林水源涵养总量较高。该数据集包括了以10 km × 10 km网格为基础的分植被类型的森林水源涵养数据,及1,045个森林水源涵养观测点数据。数据集存储为.shp.xlsx格式,由9个数据文件组成,数据量为118 MB

关键词中国;森林水源涵养;全国尺度;空间分布

DOI: https://doi.org/10.3974/geodb.2023.01.02

CSTR: https://cstr.escience.org.cn/CSTR:20146.14.2023.01.02

数据可用性声明:

本文关联实体数据集已在《全球变化数据仓储电子杂志(中英文)》出版,可获取:

https://doi.org/10.3974/geodb.2022.03.06.V1https://cstr.escience.org.cn/CSTR:20146.11.2022.03.06.V1.

1  前言

在全球气候变暖、生态环境修复困难、淡水资源匮乏等一系列背景下[1, 2],我国水污染、土地荒漠化、水土流失等一系列生态问题亟需解决,这些问题与保水持水蓄水紧密相连。森林生态系统在全球生态系统中起着决定性作用,是最重要的陆地生态系统之一[3, 4]。森林水源涵养服务是调节气候、存储水资源的重要过程,它通过对降雨的截留、持存和蓄积作用促进降雨再分配、缓和地表径流、增加土壤径流和地下径流[5]。中国幅员辽阔,气候特征多样,各地区森林水源涵养状况不一,亟需研究中国不同区域森林生态系统水源涵养空间分布情况。

目前森林水源涵养空间分布研究主要基于观测点实测和水文模型估算,大尺度森林水源涵养估算广泛应用水文模型,但是缺乏全国各区域观测点数据验证模型结果[6]。基于观测点实测数据估算森林水源涵养服务于县尺度[7]、流域尺度[8]等较为适应,较少用于空间异质性较大的全国尺度,一是全国观测点数据收集耗时耗力,二是观测点分布不均,部分地区缺少观测点数据。目前已有的基于观测点的水源涵养空间分布研究方法主要分为赋值法、回归法、机器学习与地统计法,其中机器学习与地统计法较适用于大尺度研究[6]

本数据集通过综合蓄水能力法计算了全国1,045个森林水源涵养观测点的林冠截留、枯落物持水、土壤蓄水和森林水源涵养能力,以此为基础,利用随机森林模型预测森林及其各蓄水层水源涵养空间分布特征,进一步分析森林生态系统水源涵养空间格局。

2  数据集元数据简介

《基于Meta分析的中国森林水源涵养空间分布数据集》[9]的名称、作者、地理区域、数据年代、时间分辨率、空间分辨率、数据集组成、数据出版与共享服务平台、数据共享政策等信息见表1

 

1  《基于Meta分析的中国森林水源涵养空间分布数据集》元数据简表

条目

描述

数据集名称

基于Meta分析的中国森林水源涵养空间分布数据集

数据集短名

ForestWaterRetentionChina

作者信息

吴溪, 江苏省测绘工程院, wux@lreis.ac.cn

史文娇S-3255-2018, 中国科学院地理科学与资源研究所, shiwj@lreis.ac.cn

陶福禄, 中国科学院地理科学与资源研究所, taofl@igsnrr.ac.cn

地理区域

中国(上海市、海南省、澳门特别行政区和台湾省无监测数据)

数据年代

1987–2017

时间分辨率

空间分辨率

10 km

数据格式

.shp.xlsx

数据量

118 MB

数据集组成

.shp.xlsx格式,.shp共包括12个字段,.xlsx包含两个表格

基金项目

中华人民共和国科学技术部(2017YFA0604703);中国科学院(XDA20010202XDA231002022018071);国家自然科学基金(41930647

数据计算环境

ArcGIS

出版与共享服务平台

全球变化科学研究数据出版系统http://www.geodoi.ac.cn

地址

北京市朝阳区大屯路甲11100101,中国科学院地理科学与资源研究所

数据共享政策

全球变化科学研究数据出版系统的“数据”包括元数据(中英文)、通过《全球变化数据仓储电子杂志(中英文)》发表的实体数据集和通过《全球变化数据学报(中英文)》发表的数据论文。其共享政策如下:(1)“数据”以最便利的方式通过互联网系统免费向全社会开放,用户免费浏览、免费下载;(2)最终用户使用“数据”需要按照引用格式在参考文献或适当的位置标注数据来源;(3)增值服务用户或以任何形式散发和传播(包括通过计算机服务器)“数据”的用户需要与《全球变化数据学报(中英文)》编辑部签署书面协议,获得许可;(4)摘取“数据”中的部分记录创作新数据的作者需要遵循10%引用原则,即从本数据集中摘取的数据记录少于新数据集总记录量的10%,同时需要对摘取的数据记录标注数据来源[10]

数据和论文检索系统

DOICSTRCrossrefDCICSCDCNKISciEngineWDS/ISCGEOSS

3  数据研发方法

以收集的全国1,045个水源涵养观测点为基础数据(图1),基于综合蓄水能力法计算的森林水源涵养能力为林冠层、枯落物层和土壤层截留降雨的最大能力之和。本文选取的1,045个观测点是基于Meta分析搜集国内外文献资料中包含计算森林水源涵养能力所需的5个参数(包含林冠截留率、枯落物蓄积量、枯落物最大持水率、土壤厚度、土壤非毛管孔隙度)或3个分量(林冠截留能力、枯落物最大持水能力、土壤蓄水能力)整理得来。然后,依据综合蓄水能力法计算观测点的森林及其蓄水层水源涵养能力,以此为随机森林模型的训练样本和验证数据集,构建林冠截留能力、枯落物最大持水能力、土壤蓄水能力空间分布模型;进而利用综合蓄水能力法计算空间上的森林水源涵养能力、林冠截留总量、枯落物最大持水总量、土壤蓄水总量和森林水源涵养总量。

 

 

1  森林水源涵养观测点空间分布图审图号:GS(2020)4630

 

3.1  算法原理

3.1.1  随机森林模型

中国地域宽广,水源涵养观测点提取困难,且分布不均。水源涵养影响因子既有离散变量也有连续变量。随机森林模型是一种可以预测离散和连续数据的非参数决策树分类器[11,12],由于随机森林模型在即使变量数据超过观测数据、变量之间存在较多缺失值的情况下同样有较好的预测效果[13],因此较适用于大尺度森林水源涵养量预测。本研究中水源涵养空间预测是采用R软件中的“Random Forest”模块,是以1,045个观测点水源涵养值为输入数据,森林各蓄水层水源涵养能力显著影响因子为辅助信息[13],预测林冠截留能力、枯落物持水能力和土壤蓄水能力。

在随机森林预测中,预测值为所有回归树输出结果的平均值,表达式为:

                                                                                                          (1)

式中,为预测值;为一个独立同分布的随机向量;为输入矩阵;为第i颗回归树的输出结果;k为回归树的数量。

3.1.2  综合蓄水能力法

综合蓄水能力法是在林冠截留、枯落物持水和土壤蓄水均理想的情况下,森林各蓄水层截留降雨的最大值之和。该方法是参数较多、较全面的一种森林水源涵养评价方法,综合考虑了林冠层、枯落物层和土壤层拦蓄降水作用[6]。森林水源涵养能力和总量为[14]

                                                                                                  (2)

                                                                                                      (3)

                                                                                                              (4)

                                                                                                     (5)

                                                                                                              (6)

式中,WRCiCICiLWHCiSSCi分别是i植被斑块的森林水源涵养能力(mm)、林冠截留能力(mm)、枯落物最大持水能力(mm)和土壤蓄水能力(mm)。WRAiCIAiLWHAiSSAi分别是i植被斑块的森林水源涵养总量(m3)、林冠截留总量(m3)、枯落物最大持水总量(m3)和土壤蓄水总量(m3)。Ai表示斑块面积m2i表示植被斑块。

3.2  技术路线

基于水源涵养观测点利用随机森林模型预测中国森林水源涵养空间分布数据集,步骤如下(图2):

1)森林水源涵养观测点数据收集

基于Meta分析搜集与筛选中国学术期刊网络出版总库(CNKI)和Web of Science中涉及到的森林水源涵养文献中的观测点数据,共收集1,045个观测点的水源涵养参数和森林基本信息和立地条件。

2)综合蓄水能力法

基于森林水源涵养观测点参数采用综合蓄水能力法计算的观测点林冠截留能力、枯落物最大持水能力和土壤蓄水能力[14]作为随机森林模型的输入数据。

3)随机森林模型空间预测

以计算的观测点数据为输入数据,以林冠截留、枯落物持水、土壤蓄水的显著影响因子[15]为辅助数据,基于随机森林模型构建林冠截留能力、枯落物最大持水能力和土壤蓄水能力空间分布模型。

根据随机森林模型预测的林冠截留能力、枯落物最大持水能力和土壤蓄水能力,利用综合蓄水能力法计算空间上的森林水源涵养能力、林冠截留总量、枯落物最大持水总量、土壤蓄水总量和森林水源涵养总量。

 

4)分析森林水源涵养空间分布特征

由于中国森林水源涵养存在显著的空间异质性,因此分析不同省份的森林及其各蓄水层水源涵养空间分布特征。由于上海市、海南省、澳门特别行政区和台湾省未收集到水源涵养观测点数据,因此未分析该4个省份//市的水源涵养空间分布特征。

 

2  基于Meta分析的中国森林水源涵养空间分布数据集研发技术路线图

4  数据结果与验证

4.1  数据集组成

《基于Meta分析的中国森林水源涵养空间分布数据集》[9]是由分植被类型的森林水源涵养矢量数据和统计表格组成。表格数据包含两个表格,分别是基于随机森林模型预测的中国各省森林水源涵养统计表,1,045个森林水源涵养观测点数据。森林水源涵养矢量数据相关字段如表2所示。

4.2  数据结果

4.2.1  林冠截留空间分布特征

林冠截留能力在0–37 mm内,呈由北向南递增的趋势(图3)。小于14 mm的林冠截留能力主要分布在黑龙江、内蒙古北部、山西等中国北部省份,大于26 mm林冠截留能力多分布在广东、广西、云南等中国南部省份。各省份的平均林冠截留能力相差较大(图4),在13.35–26.67 mm范围内

由于各省份植被分布面积和类型相差较大,林冠截留总量相差较大,在73.36– 488,871×104 m3内,北京、天津、江苏和宁夏均在10,000×104 m3以下,四川、云南、西藏林冠截留总量大于其他省份(图4)。每100 km2内各植被类型的林冠截留总量在0–275×104 m3范围内,大于150×104 m3主要分布在广东、广西、福建等中国南部省份(图3)。

2  森林水源涵养数据集参数及其定义

序号

字段

定义

单位

1

CIC

林冠截留能力

mm

2

LWHC

枯落物最大持水能力

mm

3

SSC

土壤蓄水能力

mm

4

WRC

森林水源涵养能力

mm

5

ForestArea

100km2内各类型植被面积

m2

6

CIA

林冠截留总量

m3

7

LWHA

枯落物最大持水总量

m3

8

SSA

土壤蓄水总量

m3

9

WRA

森林水源涵养总量

m3

10

ForestCode

植被类型代码

 

11

Prov_CN

省名称中文

 

12

Prov_EN

省名称英文

 

注:植被类型代码代表植被类型为116:寒温带和温带山地针叶林;1722:温带针叶林;2331:亚热带针叶林;3233:热带针叶林34—62;亚热带和热带山地针叶林;63:温带针叶、落叶阔叶混交林;6466:亚热带山地针叶、常绿阔叶、落叶阔叶混交林;6790:温带落叶阔叶林;9193:温带落叶小叶林;94105:亚热带落叶阔叶林;106112:亚热带常绿、落叶阔叶混交林;113135:亚热带常绿阔叶林;136141:亚热带硬叶常绿阔叶林;142146:热带季雨林;147161:热带雨林;162175:亚热带和热带竹林及竹丛;176264:灌丛。

 

 

3  林冠截留能力、林冠截留总量空间分布图审图号:GS(2020)4630

 

 

4  中国各省林冠截留能力、林冠截留总量分布特征图

 

4.2.2  枯落物持水空间分布特征

枯落物最大持水能力呈由北向南递减的趋势,与林冠截留能力相反,在0–17 mm范围内(图5黑龙江和内蒙古北部植被图斑枯落物最大持水能力较高,716 mm多是分布在这两个省份。中国南部省份,如云南、贵州、广东、广西、福建的枯落物最大持水能力较低,大多在05 mm之间。各省份的平均枯落物最大持水能力相差较小,集中在2.42– 6.54 mm(图6)。

中国各省枯落物最大持水总量在6.5–139,315.43×104 m3内,天津、江苏和宁夏远远小于其他省份,均在2,000×104 m3以下,而黑龙江、内蒙古枯落物最大持水总量大于其他省份,在100,000×104 m3以上(图6)。100 km2内各植被类型的枯落物最大持水总量在0–109×104 m3范围内,与枯落物最大持水能力分布相似,大于30×104 m3枯落物最大持水总量主要分布在黑龙江和内蒙古北部(图5)。

 

 

5  枯落物最大持水能力、枯落物最大持水总量空间分布图审图号:GS(2020)4630

 

 

6  中国各省枯落物最大持水能力、枯落物最大持水总量分布特征

 

4.2.3  土壤蓄水空间分布特征

土壤蓄水能力呈明显的南高北低趋势,在0–104 mm范围内(图7)。大于65 mm土壤蓄水能力多分布在西藏东南部、湖北和重庆交界处、江西北部和浙江。0–45 mm土壤蓄水能力主要分布在黑龙江,部分在内蒙古、辽宁、河北等省份。各省份的平均土壤蓄水能力集中在43.95–68.14 mm内,天津、黑龙江小于其他省份,西藏、浙江、重庆平均土壤蓄水能力较高(图8)。

中国各省土壤蓄水总量在182.24–1,578,417.90×104 m3内,天津、江苏和宁夏远远小于其他省份,均在20,000×104 m3以下,而四川、西藏、云南土壤蓄水总量大于其他省份,在1,000,000×104 m3以上(图8)。每100 km2内各植被类型的土壤蓄水总量在0–685×104 m3范围内,各数值段的土壤蓄水总量分布各省,大于400×104 m3主要分布在广东、福建、山西、河南(图7)。

 

 

7  土壤蓄水能力、土壤蓄水总量空间分布图审图号:GS(2020)4630

 

 

8  中国各省土壤蓄水能力、土壤蓄水总量分布特征图

 

4.2.4  森林水源涵养空间分布特征

土壤蓄水能力和总量对森林水源涵养能力和总量的贡献最大,其分布趋势一致。森林水源涵养能力在0–130 mm内,呈明显的南高北低的趋势(图9),大于90 mm森林水源涵养能力多分布在西藏东南部、湖北、四川及以南的省份。0–65 mm森林水源涵养能力主要分布在黑龙江。各省份的平均森林水源涵养能力集中在61.70–95.04 mm内,北京、天津小于其他省份,广西、江西、浙江、重庆平均森林水源涵养能力较高(图10)。

中国各省森林水源涵养总量在262.71–2,163,771.88×104 m3内,天津、江苏和宁夏远远小于其他省份,均在20,000×104 m3以下,而四川、西藏森林水源涵养总量大于其他省份,在2,000,000×104 m3以上(图10)。每100 km2内各植被类型的森林水源涵养总量在0–966× 104 m3范围内,大于500×104 m3分布在各个省份(图9)。

 

 

9  森林水源涵养能力、森林水源涵养总量空间分布图审图号:GS(2020)4630

 

 

10  中国各省森林水源涵养能力、森林水源涵养总量分布特征

 

4.3  数据结果验证

以水源涵养观测点数据集随机抽取的三分之一观测点为验证数据,对建立的林冠截留能力、枯落物最大持水能力和土壤蓄水能力空间分布模型进行精度评价。选取均方根误差(RMSE)和平均绝对误差(MAE)来判断模型的优劣,其中RMSE用于衡量观测值同真值之间的偏差;MAE来反映预测值误差的实际情况。

                                                                                                    (7)

                                                                                                          (8)

式中,为第i个样本估算的水源涵养能力,为第i个样本实际的水源涵养能力,m为样本总数。

验证结果如表3所示,林冠截留能力的RMSEMAE分别为7.19±0.14 mm4.64± 0.06 mm。枯落物最大持水能力随机森林模型验证结果为RMSE = 3.50±0.07 mmMAE = 1.97±0.05 mm。对于土壤蓄水能力,RMSE值为 35.05±0.43 mmMAE值为 22.56±0.18 mm

 

3  随机森林模型的预测精度表

指数

林冠截留能力

枯落物最大持水能力

土壤蓄水能力

RMSE±SD /mm

7.19±0.14

3.50±0.07

35.05±0.43

MAE±SD /mm

4.64±0.06

1.97±0.05

22.56±0.18

 

5  讨论和总结

为开展大尺度森林水源涵养服务研究,作者汇集了1,045个全国观测点数据构建森林水源涵养参数数据,并以观测点为基础数据,利用随机森林模型预测全国森林水源涵养空间分布特征,实现由点到面的森林水源涵养空间模拟,以此探讨森林水源涵养大尺度空间分布规律。

结果表明,基于观测数据利用随机森林模型在预测中国森林水源涵养空间分布上有较好的成效。土壤蓄水能力和总量对森林水源涵养能力和总量的贡献最大,约占54%–97%,其次是林冠截留能力和总量、枯落物最大持水能力和总量。林冠截留能力、土壤蓄水能力和森林水源涵养能力在中国呈南高北低的趋势,枯落物最大持水能力则呈相反趋势。四川、西藏、云南的林冠截留总量、土壤蓄水总量和森林水源涵养总量较高,黑龙江、内蒙古枯落物最大持水总量较高。

然而,本文基于Meta分析收集的观测点数据年代跨度较大(1987–2017),观测时长也不一致,缺少不同时间序列森林水源涵养空间分布研究。构建随机森林模型时考虑了自然因素,如气象因子、地形因子、土壤因子等,但随着陆地上人类足迹的不断扩大,原生森林遭到破坏,森林面积减少[16–18],以及我国高度重视生态文明建设,先后出台了一系列重大决策部署,开展了一系列生态保护与恢复工程[19],未来要考虑人类活动和政策实施对森林生态系统的影响。

 

作者分工:史文娇和陶福禄对数据集的开发做了总体设计;吴溪采集和处理了森林水源涵养数据;史文娇、陶福禄和吴溪设计了模型和算法;吴溪做了数据验证;吴溪撰写了数据论文。

 

利益冲突声明:本研究不存在研究者以及与公开研究成果有关的利益冲突。

参考文献

[1]      Lang, Y., Song, W., Zhang, Y. Responses of the water-yield ecosystem service to climate and land use change in Sancha River Basin, China [J]. Physics and Chemistry of the Earth, Parts A/B/C, 2017, 101: 102‒111.

[2]      Moiwo, J. P., Tao, F., Lu, W. Analysis of satellite-based and in situ hydro-climatic data depicts water storage depletion in North China Region [J]. Hydrological Processes, 2013, 27(7): 1011‒1020.

[3]      Zhang, B. A., Li, W. H., Xie, G. D., et al. Water conservation of forest ecosystem in Beijing and its value [J]. Ecological Economics, 2010, 69(7): 1416‒1426.

[4]      冯继广, 丁陆彬, 王景升等. 基于案例的中国森林生态系统服务功能评价[J]. 应用生态学报, 2016, 27(5): 1375‒1382.

[5]      Julian, J. P., Gardner, R. H. Land cover effects on runoff patterns in eastern Piedmont (USA) watersheds [J]. Hydrological Processes, 2014, 28(3): 1525‒1538.

[6]      吴溪, 史文娇. 基于实测站点的区域森林水源涵养量空间化方法综述[J]. 生态与农村环境学报, 2019, 35: 1505‒1515.

[7]      唐玉芝, 邵全琴. 乌江上游地区森林生态系统水源涵养功能评估及其空间差异探究[J]. 地球信息科学学报, 2016, 18(7): 987‒999.

[8]      刘璐璐, 邵全琴, 刘纪远等. 琼江河流域森林生态系统水源涵养能力估算[J]. 生态环境学报, 2013, 22(3): 451‒457.

[9]      吴溪, 史文娇, 陶福禄. 基于Meta分析的中国森林水源涵养空间分布数据集[J/DB/OL]. 全球变化数据仓储电子杂志, 2022. https://doi.org/10.3974/geodb.2022.03.06.V1. https://cstr.escience.org.cn/

CSTR:20146.11.2022.03.06.V1.

[10]   全球变化科学研究数据出版系统. 全球变化科学研究数据共享政策[OL]. https://doi.org/10.3974/dp. policy.2014.05 (2017年更新).

[11]   张雷, 王琳琳, 张旭东等. 随机森林算法基本思想及其在生态学中的应用——以云南松分布模拟为例[J]. 生态学报, 2014, 34(3): 650‒659.

[12]   Breiman, L. Random forests [J]. Machine learning, 2001, 45: 5‒32.

[13]   De’ath, G., Fabricius, K. E. Classification and regression trees: a powerful yet simple technique for ecological data analysis [J]. Ecology, 2000, 81(11): 3178‒3192.

[14]   Wu, X., Shi, W. J., Guo, B., et al. Large spatial variations in the distributions of and factors affecting forest water retention capacity in China [J]. Ecological Indicators, 2020, 113: 106152.

[15]   吴溪. 中国大陆森林水源涵养空间格局及其影响因素[D]. 青岛:山东科技大学, 2019.

[16]   Li, H., Li, Z., Li, Z., et al. Evaluation of ecosystem services: a case study in the middle reach of the Heihe River Basin, Northwest China [J]. Physics and Chemistry of the Earth, Parts A/B/C, 2015, 89: 40‒45.

[17]   Laino-Guanes, R., González-Espinosa, M., Ramírez-Marcial, N., et al. Human pressure on water quality and water yield in the upper Grijalva river basin in the Mexico-Guatemala border [J]. Ecohydrology & Hydrobiology, 2016, 16(3): 149‒159.

[18]   范亚宁, 刘康, 陈姗姗等. 秦岭北麓陆地生态系统水源涵养功能的空间格局[J]. 水土保持通报, 2017, 37(2): 50‒56.

[19]   Ouyang, Z., Zheng, H., Xiao, Y., et al. Improvements in ecosystem services from investments in natural capital [J]. Science, 2016, 352(6292): 1455‒1459.